# 作者: 赵若云
# 2025年02月28日03时04分46秒
# 3478783573@qq.com
import re

test_str = """
<div>
<p>岗位职责：</p>
<p>完成推荐算法、数据统计、接口、后台等服务器端相关工作</p>
<p><br></p>
 <p>必备要求：</p>
<p>良好的自我驱动力和职业素养，工作积极主动、结果导向</p>
<p>&nbsp;<br></p>
<p>技术要求：</p>
<p>1、一年以上 Python 开发经验，掌握面向对象分析和设计，了解设计模式</p>
<p>2、掌握HTTP协议，熟悉MVC、MVVM等概念以及相关WEB开发框架</p>
<p>3、掌握关系数据库开发设计，掌握 SQL，熟练使用 MySQL/PostgreSQL 中的一种<br></p>
<p>4、掌握NoSQL、MQ，熟练使用对应技术解决方案</p>
<p>5、熟悉 Javascript/CSS/HTML5，JQuery、React、Vue.js</p>
<p>&nbsp;<br></p>
<p>加分项：</p>
<p>大数据，数理统计，机器学习，sklearn，高性能，大并发。</p>
 
        </div>
 """
# 去除HTML标签和空白符和换行符
ret = re.sub(r"<[^>]*>|&nbsp;|\n", "", test_str)
print(ret)
# split 根据匹配进行切割字符串，这里是以 ":" 或 " " 进行切割
ret = re.split(r":| ", "info:xiaoZhang 33 shandong")
print(ret)

# 贪婪，非贪婪
s = "This is a number 234-235-22-423"
r = re.match(r".+(\d+-\d+-\d+-\d+)", s)
print(r.group(1))  # 23被.匹配到，所以输出4-235-22-423
r = re.match(r".+?(\d+-\d+-\d+-\d+)", s)  # 加？表示非贪婪，能被\d+匹配到的尽量匹配到，.尽量少匹配
print(r.group(1))
